AI资讯新闻榜单内容搜索-deepseek V

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: deepseek V
DeepSeek刚提到FP8,英伟达就把FP4精度推向预训练,更快、更便宜

DeepSeek刚提到FP8,英伟达就把FP4精度推向预训练,更快、更便宜

DeepSeek刚提到FP8,英伟达就把FP4精度推向预训练,更快、更便宜

前些天,DeepSeek 在发布 DeepSeek V3.1 的文章评论区中,提及了 UE8M0 FP8 的量化设计,声称是针对即将发布的下一代国产芯片设计。

来自主题: AI资讯
6343 点击    2025-08-28 15:40
DeepSeek“极你太美”bug,官方回应了

DeepSeek“极你太美”bug,官方回应了

DeepSeek“极你太美”bug,官方回应了

DeepSeek V3.1上演的bug大秀“极你太美”,可谓是让全网热议了一波。 简单来说呢,就是陆续有开发者们发现,当他们在调用API进行代码开发的过程中,输出结果里会时不时蹦出来“极”字。

来自主题: AI资讯
6079 点击    2025-08-27 17:09
热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?

上周三,DeepSeek 开源了新的基础模型,但不是万众期待的 V4,而是 V3.1-Base,而更早时候,DeepSeek-V3.1 就已经上线了其网页、App 端和小程序。

来自主题: AI资讯
6116 点击    2025-08-26 19:44
突发!Deepseek最新模型被外网爆出恶性Bug??

突发!Deepseek最新模型被外网爆出恶性Bug??

突发!Deepseek最新模型被外网爆出恶性Bug??

一早起来,看到群里炸了锅!主角是我们备受期待的 DeepSeek V3.1 模型。有用户反馈,该模型在生成文本时,会毫无征兆地随机插入“极”这个汉字(繁体简体都会)

来自主题: AI资讯
8049 点击    2025-08-26 10:14
仅靠5000+样本,全新强化学习范式让30B轻松击败671B的DeepSeek V3

仅靠5000+样本,全新强化学习范式让30B轻松击败671B的DeepSeek V3

仅靠5000+样本,全新强化学习范式让30B轻松击败671B的DeepSeek V3

蚂蚁技术研究院联合浙江大学开源全新强化学习范式 Rubicon,通过构建业界最大规模的 10,000+ 条「评分标尺」,成功将强化学习的应用范围拓展至更广阔的主观任务领域。用 5000 样本即超越 671B 模型,让 AI 告别「机械味」。

来自主题: AI技术研报
5137 点击    2025-08-25 10:08
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥

DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥

DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥

DeepSeek V3.1发布后,一则官方留言让整个AI圈都轰动了,新的架构、下一代国产芯片,总共短短不到20个字,却蕴含了巨大信息量。

来自主题: AI资讯
6028 点击    2025-08-22 18:54
手把手:1分钟把 Claude Code 迁到 DeepSeek V3.1,开箱即干

手把手:1分钟把 Claude Code 迁到 DeepSeek V3.1,开箱即干

手把手:1分钟把 Claude Code 迁到 DeepSeek V3.1,开箱即干

今天下午,DeepSeek 官方正式发布 DeepSeek-V3.1。相比于前天只在用户群里通知,今天新增了模型升级点、榜单成绩、model card,huggingface 上现在也可以下载模型文件了。

来自主题: AI资讯
5740 点击    2025-08-22 18:13
实测DeepSeek V3.1,不止拓展上下文长度

实测DeepSeek V3.1,不止拓展上下文长度

实测DeepSeek V3.1,不止拓展上下文长度

DeepSeek V3.1和V3相比,到底有什么不同?官方说的模模糊糊,就提到了上下文长度拓展至128K和支持多种张量格式,但别急,我们已经上手实测,为你奉上更多新鲜信息。

来自主题: AI产品测评
7318 点击    2025-08-21 10:49
DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

DeepSeek V3.1新版正式上线,上下文128k,编程实力碾压Claude 4 Opus,成本低至1美元。在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。

来自主题: AI资讯
6253 点击    2025-08-20 12:56
刚刚DeepSeek发布3.1版本,实测有进步,在编程等个别场景可硬刚GPT-5

刚刚DeepSeek发布3.1版本,实测有进步,在编程等个别场景可硬刚GPT-5

刚刚DeepSeek发布3.1版本,实测有进步,在编程等个别场景可硬刚GPT-5

没等到Deepseek R2,DeepSeek悄悄更新了V 3.1。官方群放出的消息就提了一点,上下文长度拓展至128K。128K也是GPT-4o这一代模型的处理Token的长度。因此一开始,鲸哥以为从V3升级到V 3.1,以为是不大的升级,鲸哥体验下来还有惊喜。

来自主题: AI资讯
7913 点击    2025-08-20 03:37